Motifs séquentiels multidimensionnels étoilés
نویسندگان
چکیده
L’extraction de motifs séquentiels est un domaine de la fouille de données permettant de rechercher des corrélations fréquentes entre des valeurs en prenant en compte leur chronologie d’apparition. Dans le contexte du panier de la ménagère, ce type de méthodes permet par exemple l’extraction de règles de la forme 〈(TV,DV D)(magneto numerique)〉, indiquant qu’un nombre suffisamment important (au sens du support) de clients ont acheté d’abord un téléviseur et un lecteur DVD puis un magnétoscope numérique. Si de nombreux travaux permettent l’extraction de tels motifs, il n’en reste pas moins que ces motifs sont parfois très pauvres par rapport aux bases de données qu’ils décrivent. En effet, il n’existe pas à l’heure actuelle de méthode permettant de mettre en exergue des corrélations entre valeurs de différents attributs, par exemple pour découvrir des règles de la forme 〈{(surf,NY ), (housse,NY )}, {(combi, SF )}〉 indiquant qu’un nombre important de personnes ont acheté leur planche de surf et la housse à New York avant de se rendre à San Francisco où ils ont acheté une combinaison. Si la littérature recense des contributions liées aux motifs séquentiels multidimensionnels proposées par l’équipe de Jiawei Han, celles-ci ne permettent pas de combiner plusieurs attributs au sein des motifs extraits. Dans cet article, nous montrons donc les limites des approches existantes et proposons une approche complète d’extraction de motifs multidimensionnels multi-attributs. Nous définissons les concepts associés à ces motifs et décrivons les algorithmes permettant leur extraction. Ces algorithmes sont validés par des expérimentations montrant l’intérêt de notre approche.
منابع مشابه
Salines : un automate au service de l'extraction de motifs séquentiels multidimensionnels
Résumé. Les entrepôts de données occupent aujourd’hui une place centrale dans le processus décisionnel. Outre leur consultation, une des finalités des entrepôts est de servir de socle aux techniques de fouilles de données. Malheureusement, les approches existantes exploitent peu les particularités des entrepôts (multidimensionnalité, hiérarchies et données historiques). Parmi ces méthodes, l’ex...
متن کاملExtraction de Motifs Séquentiels Multidimensionnels Clos sans Gestion d'Ensemble de Candidats
HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...
متن کاملHype : Prise en compte des hiérarchies lors de l'extraction de motifs séquentiels multidimensionnels
HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...
متن کاملFouille de Données Multidimensionnelles : Différentes Stratégies pour Prendre en Compte la Mesure
Résumé. Les entrepôts de données contiennent de gros volumes de données historisées stockées à des fins d’analyse. Des techniques d’extraction de motifs séquentiels multidimensionnels ont été développées afin de mettre en exergue des corrélations entre des positions sur des dimensions au cours du temps. Même si ces méthodes offrent une meilleure appréhension des données sources en prenant en co...
متن کاملExtraction de motifs séquentiels. Problèmes et méthodes
SYNOPSIS. Dans un premier temps, le problème de l’extraction de motifs séquentiels peut sembler proche de celui de l’extraction de règles d’association. Ce rapprochement s’avère cependant très fragile en raison d’un élément clé qui est propre à l’extraction de motifs séquentiels : la temporalité. Cette notion permet à la fois de distinguer à l’intérieur des enregistrements un ordre d’apparition...
متن کامل